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Circulation du discours médical de Jean-Martin Charcot : 
premières observations 


Ljudmila Petkovic, Motasem Alrahabi, Glenn Roe 
Sorbonne Université, équipe-projet ObTIC 
{prenom.nom}@sorbonne-universite.fr 


Résumé 


Cette proposition de communication se veut 
une première réflexion liée à la mesure du de- 
gré d’intertextualité entre Jean-Martin Charcot 
(1825-1893) et son réseau scientifique et ar- 
tistique au prisme des humanités numériques. 
L'approche consiste à comparer les textes écrits 
par Charcot avec ceux de ses collaborateurs et 
successeurs, via les concepts-clés liés à son 
discours scientifique. Les expériences menées 
sur la circulation des concepts d’un corpus à 
l’autre se base sur les mesures TF-IDF, BM- 
25 et BERT, et les résultats obtenus semblent 
probants. Au-delà du cas de Charcot, ce travail 
vise à établir un protocole permettant d’appré- 
hender la circulation de concepts de manière 
automatisée. 


1 Introduction 


Depuis les premières descriptions du cervelet 
humain faites de manière rigoureuse par Constanzo 
Varolio (1543-1575) en 1573 (Kneib, 2011) !, sui- 
vies par la création du terme neurologia par Tho- 
mas Wilis (1621-1675) °, l’histoire de la neurologie 
trouve son ancrage au XIX" siècle dans les travaux 
de Jean-Martin Charcot (1825-1893), considéré 
comme le père de la neurologie française et mo- 
derne (Teive et al., 2022 ; Broussolle et al., 2012). 

Figure emblématique du célèbre hôpital de la 
Salpêtrière à Paris, Charcot est essentiellement 
connu pour ses études sur les troubles névrotiques, 
notamment sur l’hystérie, l’ hypnose, la double per- 
sonnalité, la catalepsie et le somnambulisme °. Ses 
idées novatrices ont eu un grand retentissement 
parmi ses collaborateurs : Pierre Janet (1859-1947), 
Joseph Babinski (1857-1932), Gilles de La Tou- 
rette (1857-1904), Paul Richer (1849-1933), Dé- 

1. Il s’agit des descriptions de la structure cérébrale, appe- 
lée pont (lat. pons) par Varolio (1573), puis pont de Varole en 
l’honneur du célèbre anatomiste. 

2. Cf. Willis (1664). 

3. Ces explorations des abîmes de l’esprit humain lui ont 


valu l’appellation de « Napoléon des névroses » (Ellenberger, 
1970). 


siré Magloire Bourneville (1840-1909), pour n’en 
nommer que quelques-uns (Bogousslavsky, 2011), 
mais aussi parmi ceux qui lui étaient radicalement 
opposés, comme Hippolyte Bernheim (1840-1919) 
et l’école de Nancy pendant les années 1880-1890 4. 
L'impact colossal de Charcot sur sa propre disci- 
pline est bien connu : mentionnons seulement le 
changement d'intérêt radical de Sigmund Freud 
(1856-1939), passant de la neurologie générale à 
l’hystérie, l’ hypnose et d’autres troubles psycholo- 
giques, ce qui a donné lieu au développement de 
la théorie psychanalytique, à la suite de son séjour 
dans le service de neurologie de Charcot pendant 
l'hiver 1885-1886 (Camargo et al., 2018). 

Nous visons à mesurer informatiquement l’im- 
pact de Charcot sur son réseau scientifique et artis- 
tique Ž. Cette mesure se fonde sur l’analyse de ses 
concepts-clés en matière de discours scientifique, et 
plus particulièrement sur l’opérationnalisation du 
terme « influence », définie ici comme une intertex- 
tualité uni-directionnelle, allant des écrits de Char- 
cot vers ceux de ses collaborateurs et successeurs 
(ci-après corpus « Autres »). Il s’agit donc in fine 
d’aborder computationnellement la question des 
circulations, non pas des artefacts matériels comme 
les manuscrits (Gabay et al., 2021) et les images 
(Joyeux-Prunel, 2019), mais des phénomènes tex- 
tuels complexes (Manjavacas et al., 2019) ayant 
une dimension théorique forte. 


2 Méthodologie 


2.1 Outils existants 


Le corpus de travail est constitué de 201 do- 
cuments OCRisés (sans post-correction), fournis 


4. Contrairement à la définition de Charcot, qui voyait 
en l’hypnose un état pathologique propre aux hystériques, 
Bernheim (1891) définit l’ hypnose comme un simple som- 
meil produit par la suggestion et susceptible d’applications 
thérapeutiques. 

5. Par ailleurs, le présent travail fait partie 
du projet doctoral en cours https://obtic. 
sorbonne-universite.fr/projet/charcot. 


ND 


Corpus : Charcot 
Alphabétique Y) 


> Filtres 


4647 occurrences trouvées dans 334 chapitres 
Auteur (occurrences =À 


2 | Bulbe rachidien 2 h 


NUAGE | | RÉSEAU | | FRÉQUENCES EXTRAITS | | CONCORDANCE | DOCUMENT | AIDE 


Enregistrer | Nommer cet 


Rue trouvés / total $ auteur + date $ titre $ occs # chaps. # pertinence 
SE) Dejerine, Jules ; Dejerine-Klumpke, 1901 Anatomie des centres nerveux. Tome 2, Fascicule 1 : Anatomie du cerveau 557 1  2935,90431 
Babinski, Joseph (76 0. — 3 ch. / 6) Augusta. (suite), anatomie du rhombencéphale 

Ball, Benjamin (3 o. — 1 ch. / 2) Chazal, Antoine et al. 1839 Anatomie comparée du système nerveux considéré dans ses rapports avec 195 1 752,14575 
Barré, Jean-Alexandre (55 0. — 1 ch. 7 l'intelligence. Tome second 

Beau, Émile (8 o. — 1 ch. / 2) Gavoy, Emile-Alexandre ; Vulpian, 1886  L'encéphale : structure et description iconographique du cerveau, du 105 i 584,72222 
Bérillon, Edgar (26 o. — 14 ch. / 44) Alfred. cervelet et du bulbe : avec atlas de 59 planches en glyptographie 

Bérillon. Edgar (17 o. — 1 ch. / 2) Dejerine, Jules ; Dejerine-Klumpke, 1895 Anatomie des centres nerveux. Tome 1 : Méthodes générales d'étude- 155 1 350,55843 
Bernard, Claude (85 0. — 3 ch. / 6) Augusta. embryologie-histogénèse et histologie, anatomie du cerveau 

Bernard, Désiré (7 o. — 1 ch. / 2) Cruveilhier, Jean ; Chazal, Antoine. 1829 Anatomie pathologique du corps humain : ou descriptions, avec figures 153 1 344,61341 


Bion, F. (8 o. — 1 ch. / 2) 
Bourgery, Jean-Marc (85 0. — 3 ch. / 


lithographiées et coloriées, des diverses altérations morbides dont le corps 
humain est susceptible. Tome second 


Bourneville, Désiré Magloire (1761 @« Gilles de la Tourette, Georges. 1905 Nouvelle iconographie de la Salpétrière [Tome 18] : recueil consacré à 125 1 286,51835 
Bouvier, Sauveur Henri Victor (15 0. l'iconographie médicale et artistique 
Brissaud, Édouard (133 0. — 6 ch. / 12 Bourneville, Désiré Magloire ; Charcot, 1886 Oeuvres complètes de J. M. Charcot. Tome 2. Leçons sur les maladies du 85 1 231,10402 


Charcot, Jean-Baptiste (3 0. — 1 ch. Jean-Martin. 


Charcot, Jean-Martin (1594 o. — 67 c 


Chazal, Antoine (457 o. — 5 ch. / 10) — bulbe 

Colin, Henri (3 o. — 1 ch. / 2) 30F rachidien 

Crouzon, Octave (122 0. — 1 ch. / 2) e j 

Cruveilhier, Jean (208 o. — 2 ch. / 4) a Mal 

Dejerine, Jules (712 0. — 2 ch. / 4) ta 

Dejerine-Klumpke, Augusta (7120. & 10 

Delamare, G. (122 o. — 1 ch. / 2) \ 

Desnos, Ernest (122 0. — 1 ch. / 2) 6 \ À 

Duprat, A. (30.— 1 ch. / 2) ä \ J \ m 

Féré, Charles (7 o. — 1 ch. / 2) Ae / \ 

Flower, William Henry (3 0. — 1 ch. / L v. 
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FIGURE 1 — Distribution des fréquences des tokens avec la frise chronologique pour ceux constituant l’ expression 
bulbe rachidien (issus du corpus « Charcot » et du corpus « Autres ») dans l’application OBVIE. 


au format XML par la Bibliothèque de Sorbonne 
Université (BSU) f. Nous avons procédé, dans un 
premier temps, à une restructuration des textes en 
XML-TEL afin de permettre la fouille avancée du 
corpus Charcot à travers des outils développés au 
sein de notre équipe. D’une part, notre moteur de 
recherche OBVIE permet de repérer des textes si- 
milaires par ordre de pertinence à partir des termes 
en commun”. D’autre part, l’algorithme TextPair 
génère une liste de passages similaires, c’est-à- 
dire les séquences de mots qui se chevauchent (n- 
grammes de mots) pour chaque texte, en comparant 
ensuite ces résultats avec ceux de séquences dans 
d’autres textes 8. 

Afin de mesurer l’impact de Charcot sur son 
entourage et d’analyser la circulation de concepts 
véhiculés dans le corpus, nous avons commencé 
par séparer les textes rédigés par Charcot de ceux 
rédigés par ses co-auteurs (p. ex. Bourneville) ou 
les auteurs thématiquement proches de lui (p. ex. 
de la Tourette). Nous avons obtenu respectivement 
6. Ces archives sont disponibles sur le portail numérique 
SorbonNum (anc. Bibliothèque numérique patrimoniale de 
l’université Pierre et Marie Curie — UPMC) qui représente 
le point d’entrée unique vers les collections scientifiques pa- 
trimoniales et numériques de Sorbonne Université : https: 
//patrimoine.sorbonne-universite.fr/. 

7. https://obtic.huma-num.fr/obvie/. Pour 
d’amples informations sur le fonctionnement de cet outil, cf. 
Alrahabi (2022). 


8. https://artfl-project.uchicago.edu/ 
text-pair. 


68 (corpus « Charcot ») et 133 (corpus « Autres ») 
textes ?. Une première exploration du corpus Char- 
cot à travers l’application OBVIE nous a permis 
d'identifier les substantifs les plus importants de 
chaque corpus en utilisant les fréquences brutes ou 
des méthodes plus fines comme TF-IDF, BM25, 
x? ou le Test Gamma. Cependant, l'application ne 
permet pas de quantifier la pertinence des expres- 
sions polylexicales (1.e. les n-grammes de mots), 
très fréquentes dans les deux corpus et dont la dé- 
composition entraînerait une perte d’information 
(p. ex. le terme polysémique « bulbe » qui a une 
valeur spécifique dans l’expression figée bulbe ra- 
chidien, cf. fig. 1). 

Concernant l’alignement des séquences simi- 
laires aux deux corpus, TextPair nous a permis, 
par une lecture attentive, de faire des comparai- 
sons entre les textes et de rechercher des termes au 
sein des passages similaires, malgré le nombre de 
résultats assez conséquent (cf. fig. 2). 

Les deux corpus issus du fonds Charcot sont 
librement disponibles et interrogeables sur les deux 
plateformes OBVIE !° et TextPair !!. 

9. Le corpus contient 31 979 479 tokens au total, dont 12 
190 649 (38,12%) dans le corpus « Charcot » et 19 788 830 
(61,88%) dans le corpus « Autres ». 

10. https://obtic.huma-num.fr/obvie/ 
charcot/?view=corpus 


11. https://anomander.uchicago.edu/ 
text-pair/charcot?2autres/ 


Source 


Charcot, Jean-Martin e Archives de 
neurologie [Tome 26, n° 77-82] : revue des 
maladies nerveuses et mentales e 


nouveaux cas de sclérosé latérale 
amyotrophique suivis d'autopsie (en 
collaboration avec Marie), 1885 ; De 
l'Ozzonzatomaazie (en collabora- tion avec 
Magnan), 188 ? - Deux nouveaux cas de 
sclérose latérale amyotrophique suivis 
d'autopsie (en collaboration avec Marie), 
1885 ; - Rapport médico-légal sur Annette 
G... (en collaboration avec Brouardel et 


Target 


Gilles de la Tourette, Georges + Nouvelle 
iconographie de la Salpétrière [Tome 23] : 
iconographie médicale et artistique © 


rale amyotrophique, dans lesquels ils ont 
noté l'atrophie et la dispa- rition des 
cellules de Betz ; ils s'en ont servi pour 
délimiter la zone (1) CHARCOT et Marie. 
Deux nouveaux cas de sclérose latérale 
amyotrophique suivis d'autopsie . Arch. de 
Neurologie, 1885, nos 28-29. (2) F. 
Lennmalm. Bidrag till Kannedomen om 
den amyolrofiska laleralsklerosen., Upsala 


Browse by Metadata 
Counts 


Source 
Passage 
Author 
Tite 
Year 


Passage Length 


Target 


Passage 


lékarefbreu for, 1887, n° 7. Analysé in 


Mottet), 1880 ; - Rapport présenté à M. le 
Neurol. Centralbl, 1881, p. 550. Author 


Ministre de 
Title 


View passage in context Hide differences 
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FIGURE 2 — Alignement et comparaison des textes de 
Charcot à celui de Georges Gilles de la Tourette (le seul 
résultat) en lançant la requête sclérose latérale 
amyotrophique. 


2.2 Une nouvelle approche 


Afin de surmonter les limites rencontrées avec 
ces deux outils, nous proposons une nouvelle mé- 
thode pour identifier des concepts dans les deux 
corpus en nous basant sur le poids de leur appa- 
rition, calculé selon trois différentes mesures de 
pondération !? : 

— TF-IDF est une méthode qui permet d’éva- 
luer l’importance d’un terme contenu dans 
un document relativement à un corpus plus 
large en récompensant la fréquence des 
termes et en pénalisant la fréquence des do- 
cuments. 

— BM25 est une tentative d'amélioration de TF- 
IDF, notamment pour traiter les documents 
de grande longueur et les problèmes engen- 
drés par la possible saturation des termes 
(Robertson et Sparck Jones, 1988). 

— BERT (Devlin et al., 2018) est un modèle 
pré-entraîné qui utilise l’ apprentissage non- 
supervisé sur de grandes quantités de don- 
nées textuelles pour apprendre des représen- 
tations de mots et de phrases, et comprendre 
le contexte et la sémantique. Il est basé sur 
P architecture des transformeurs, qui est un 
type de réseau de neurones utilisé pour le 
traitement du langage naturel. 

La liste des concepts retenus pour l’étude est 
composée de termes ou expressions popularisés 
par Charcot (Walusinski et Bogousslavsky, s.d.), 
comme hystérie, sclérose latérale etc. B Elle pro- 
vient du croisement entre la liste des termes obtenus 
avec OBVIE et l’index d’une édition des œuvres 


12. Le code est disponible en ligne : https://github. 


com/ljpetkovic/Charcot_circulations. 

13. Pour chaque entrée, nous avons pris en compte les 
formes du singulier et du pluriel obtenues grâce à des ex- 
pressions régulières. 


complètes de Charcot (1892), dont nous avons re- 
tiré les termes génériques (os, cerveau, etc.). 


3 Résultats 


Comme nous pouvons l’observer sur la fig. 3, la 
mesure BM25 révèle une intensification du lexique 
de Charcot dans le corpus « Autres », les scores 
étant plus élevés pour 14 termes (sur 14 évalués) 
utilisés par le réseau de Charcot. D'ailleurs, d’après 
le tableau 1, c’est la seule mesure dont les va- 
leurs témoignent clairement d’un lexique partagé 
entre Charcot et ses successeurs et collaborateurs, a 
contrario des deux autres mesures, où le rapport en 
question est inversé (la grande majorité des termes 
étant plus pertinente dans le discours de Charcot, 
et son impact étant donc moins accentué). Concrè- 
tement, les termes les plus pertinents semblent être 
sclérose en plaque disséminées (score 0,83), pa- 
ralysie rhumatismale (0,68), atrophie progressive 
(0,53) et arthrite déformante (0,50). 

D'autre part, nous avons utilisé BERT pour me- 
surer le poids des termes dans les deux corpus. 
Bien que ce type de modèle ne fournisse pas 
directement de poids pour les mots, nous pour- 
rions cependant en extraire des informations utiles 
pour estimer l’importance ou le poids des mots 
dans les textes. Différentes approches sont gé- 
néralement utilisées pour obtenir une représen- 
tation de l’importance des mots, en exploitant 
les informations des plongements lexicaux et des 
mécanismes d’attention (Vaswani et al., 2017). 
Pour ce travail en cours, nous avons utilisé le 
modèle bert-base-multilingual-cased. 
Les premiers résultats obtenus se trouvent dans le 
tableau 1 et restent à améliorer. Cependant, nous 
avons observé que les termes les plus pertinents 
pour le discours de Charcot étaient ceux qui dési- 
gnent les noms des différentes pathologies (diplo- 
pie, myélite partielle, état de mal épileptique, para- 
lysie labio-glosso-laryngée etc.), contrairement à 
d’autres notions plus abstraites (préambule, délire, 
miracle) qui sont prédominantes dans le corpus 
« Autres » (termes non renseignés dans le tableau 
en question). 


4 Discussion et perspectives 


Ce travail constitue la première phase d’explora- 
tion du corpus de Charcot. Les deux outils, OBVIE 
et TextPair, nous offrent des fonctionnalités avan- 
cées de recherche et de comparaison de textes dans 
le cadre d’une analyse de textes assistée par ordina- 
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FIGURE 3 — Visualisation de pertinence des concepts dans les deux corpus suivant la mesure BM25. Les valeurs des 
concepts associées au corpus « Charcot » sont représentées en bleu, alors que celles du corpus « Autres » en jaune. 


teur. Cependant, ils ne proposent pas de fonctionna- 
lité de lecture distante permettant de rendre compte 
de l’impact de Charcot sur son réseau scientifique 
et artistique à travers les concepts principaux de ses 
travaux. L’analyse effectuée à l’aide d’un nouveau 
script nous a alors permis de quantifier les concepts 
polylexicaux dans les deux corpus, selon trois dif- 
férentes métriques de pondération. La visualisation 
des résultats nous a permis d’observer des phéno- 
mènes qu’il serait nécessaire de valider auprès de 
spécialistes de Charcot. 

Pour la suite, trois pistes de recherche devraient 
être suivies : 1. comparer l’œuvre de Charcot avec 
la production qui le précède afin de vérifier s’il 
est vraiment l’initateur de certains termes ou bien 
s’il en est simplement le transmetteur ; 2. opérer 
une analyse sémantique des passages qui contien- 
draient nos concepts, afin d’étudier les différentes 
modalités de prise en charge énonciative : opinions, 
accords, désaccords, définitions, etc. (Alexandre 
et al., 2022). En effet, reprendre un terme ne veut 
pas dire y adhérer : on peut citer pour dire que l’on 
n’est pas d’accord; 3. améliorer le texte issu de 


POCR et évaluer l’impact de la correction ortho- 
graphique de notre corpus sur ces résultats, à l’aide 
d’une approche à base d’apprentissage profond. 
(Petkovic et al., 2023). 


5 Remerciements 


Nous remercions vivement Simon Gabay et 
Valentina Fedchenko pour leur relecture et leurs 
conseils précieux. 


Bibliographie 


Didier Alexandre, Motasem Alrahabi, Marine Riguet, 
Alexandre Duguet, Marie-Christine Renaud, et Fré- 
dérick Gay. 2022. Le médical et le social. Analyse 
sémantique des rapports de l’immersion d’étudiants 
en médecine dans le Samu social. Cultures et pra- 
tiques savantes du numérique, pages 817-846. 


Motasem Alrahabi. 2022. Obvie: interface web pour 
la fouille et la comparaison de textes. In Atelier Di- 
gitAl Humanities and cuLtural herltAge : data and 
knowledge management and analysis durant la confé- 
rence francophone sur l’ Extraction et la Gestion des 
Connaissances (egc2022), Paris, France. 


Hippolyte Bernheim. 1891. De la suggestion: et de ses 


applications à la thérapeutique : (3e édition corrigée 
et augmentée). Octave Doin, Paris. 


Julien Bogousslavsky. 2011. Hysteria after Charcot: 
Back to the Future. In Following Charcot : A Forgot- 
ten History of Neurology and Psychiatry, Volume 29, 
pages 137-161. Karger Publishers. 


Emmanuel Broussolle, Jacques Poirier, François Cla- 
rac, et Jean-Gaël Barbara. 2012. Figures and institu- 
tions of the neurological sciences in Paris from 1800 
to 1950. Part IN: Neurology. Revue Neurologique, 
168(4) :301-320. 


Carlos Henrique Camargo, Paula Teixeira Marques, Li- 
via Oliveira, Francisco Germiniani, Luciano de Paola, 
et Helio Teive. 2018. Jean-Martin Charcot’s in- 
fluence on Career of Sigmund Freud, and the In- 
fluence of this Meeting for the Brazilian Medicine. 
Revista Brasileira de Neurologia, 54(2) :40-46. 


Jean-Martin Charcot. 1892. Œuvres complètes de J.- 
M. Charcot : Leçons sur les maladies du système 
nerveux, Volume 1. Bureaux du Progrès médical, 
Paris. 

Jacob Devlin, Ming-Wei Chang, Kenton Lee, et Kristina 
Toutanova. 2018. BERT: pre-training of deep bidi- 
rectional transformers for language understanding. 
CoRR, abs/1810.04805. 


Henri F. Ellenberger. 1970. The Discovery of the Un- 
conscious: The History and Evolution of Dynamic 
Psychiatry, volume 1. Basic books, New York. 


Simon Gabay, Ljudmila Petkovic, Alexandre Bartz, Mat- 
thias Gille Levenson, et Lucie Rondeau Du Noyer. 
2021. Katabase: À la recherche des manuscrits ven- 
dus. In Humanistica 2021, Rennes, France. 


Béatrice Joyeux-Prunel. 2019. Visual Contagions, the 
Art Historian, and the Digital Strategies to Work on 
Them. Artl@s Bulletin, 8(3) :8. 


Marie Kneib. 2011. Étude fonctionnelle d’un circuit 
inhibiteur du cortex cérébelleux de la souris: Impor- 
tance pour la physiopathologie des retards mentaux. 
Thèse de doctorat, Strasbourg. 


Enrique Manjavacas, Brian Long, et Mike Kestemont. 
2019. On the feasibility of automated detection of 
allusive text reuse. In Proceedings of the 3rd Joint 
SIGHUM Workshop on Computational Linguistics 
for Cultural Heritage, Social Sciences, Humanities 
and Literature, pages 104-114, Minneapolis, USA. 
Association for Computational Linguistics. 


Ljudmila Petkovic, Motasem Alrahabi, et Glenn Roe. 
2023. Impact de la correction automatique de 
l'OCR/HTR sur la reconnaissance d’entités nom- 
mées dans un corpus bruité. Journal of Information 
Sciences, 21(2). 


Stephen E. Robertson et Karen Sparck Jones. 1988. Re- 
levance Weighting of Search Terms, page 143-160. 
Taylor Graham Publishing, GBR. 


Hélio Afonso Ghizoni Teive, Léo Coutinho, Carlos Hen- 
rique Ferreira Camargo, Renato Puppi Munhoz, et 
Olivier Walusinski. 2022. Thomas Willis’ legacy 
on the 400! anniversary of his birth. Arquivos de 
Neuro-Psiquiatria, 80 :759-762. 


Constanzo Varolio. 1573. De nervis opticis nonnullisq: 
aliis praeter communem opinionem in humano capite 
obseruatis. Patavii : apud P. et A. Meiettos fratres. 


Ashish Vaswani, Noam Shazeer, Niki Parmar, Jakob 
Uszkoreit, Llion Jones, Aidan N. Gomez, Lukasz 
Kaiser, et Illia Polosukhin. 2017. Attention Is All 
You Need. CoRR, abs/1706.03762. 


Olivier Walusinski et Julien Bogousslavsky. s.d. Jean- 
Martin Charcot, Pierre Janet et leurs conceptions 
psychopathologiques. Consulté sur le site http: 
//baillement .com/. 


Thomas Willis. 1664. Cerebri anatome: cui accessit 
nervorum descriptio et usus. Londini : Typis Ja. Fle- 
sher, impensis Jo. Martyn & Ja. Allestry, apud insigne 
Campanæ in Cœmeterio, D. Pauli. 


Charcot Autres 
Terme Fréquence TF-IDF BM25 BERT | Fréquence TF-IDF BM25 BERT 
Arthrite déformante 30 0,16 0,45 0,80 24 0,02 0,50 0,40 
Ataxie locomotrice 559 0,35 0,05 0,83 169 0,08 0,25 0,39 
Atrophie musculaire 1105 0,20 0,02 0,84 1465 0,43 0,15 0,42 
Atrophie progressive 40 0,14 0,27 0,72 22 0,02 0,53 0,39 
Catalepsie 681 0,54 0,07 0,88 975 0,28 0,15 0,39 
Épilepsie 414 0,09 0,02 0,78 577 0,12 0,10 0,41 
Hystérie 5775 0,51 0,01 0,74 4934 0,45 0,05 0,41 
Langue 2695 0,24 0,01 0,72 3591 0,11 0,02 0,41 
Maladie de Parkinson 75 0,21 0,23 0,81 130 0,09 0,35 0,37 
Paralysie bulbaire 149 0,27 0,15 0,89 93 0,09 0,52 0,40 
Paralysie rhumatismale 8 0,07 0,67 0,86 14 0,02 0,68 0,44 
Sclérose latérale 445 0,30 0,06 0,88 127 0,09 0,37 0,41 
Sclérose en plaque disséminées 45 0,25 0,47 0,87 12 0,02 0,83 0,40 
Somnambulisme 847 0,49 0,05 0,89 3410 1 0,15 0,43 


TABLEAU 1 — Calcul de pertinence des concepts selon les mesures TF-IDF, BM25 et BERT dans les corpus « Charcot » et « Autres » (les meilleurs scores sont affichés en gras). 


